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摘 要 : [目的 /意义 ] 科 学 知识 网 络 中 知识 单元 呈现 出 一 定 的 集群 性 与 社区 性 ,揭示 科学 知识 网 络 扩散 时 序 变 化 过 程 中 的 
社区 扩张 与 收敛 的 基本 模式 与 特征 ,对 于 拓展 、 深 化 科学 知识 扩散 与 传递 规律 研究 具有 一 定 的 意义 。 [方法 /过 
程 ] 首先 ,基于 引用 关系 建立 邻接 给 阵 进而 构建 学 科 知 识 网 络 , 采 用 复杂 网 络 分 析 中 的 Louvain 社区 探测 算法 对 领 
域 知识 网 络 进行 社区 划分 ;然后 利用 网 络 表示 学 习 技 术 进 行 社区 扩张 与 收敛 特征 表示 与 计算 ;最 后 以 时 间 序 列 为 


张 与 收敛 的 基本 模式 与 特征 。[ 
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逻辑 线索 ,对 不 同 社区 的 扩张 ,收敛 演变 过 程 进行 动态 跟踪 建 模 ,从 而 揭示 科学 知识 网 络 时 序 变化 过 程 中 社区 扩 
结果 /结论 ] 以 医疗 健康 信息 领域 进行 案例 研究 ,研究 发 现 社区 扩张 模式 的 发 展 趋 
势 符合 $ 形 曲线 函数 中 的 Logistic 模型 ,社区 收敛 模式 的 发 展 趋 势 符合 S 形 曲线 函数 中 的 BiHill 模型 。 

网 络 表示 学 习 ”扩张 模式 ”收敛 模式 


在 数据 科学 时 代 背 景 下 , 随 着 科技 创新 环境 不 断 
完 医科 学 文献 数量 爆发 式 增长 数字 出 版 行业 及 其 相 
关 授 术 的 快速 发 展 ,推动 全 球 范围 内 的 科学 文献 传播 ， 
如题 了 世界 科学 知识 交流 ,进一步 促进 了 科学 技术 的 
协同 发 展 。 目 前 企业 界 学术 界 十 分 重视 对 海量 科学 
文 向 的 存储 . 挖 所 和 利用 等 ,但 是 关于 科学 文献 中 蕴含 
的 知识 增长 .传播 影响 因素 .基本 特征 和 机 理 规律 等 问 
题 的 研究 有 待 深化 。 

在 科学 文献 传播 过 程 中 ,文献 作为 知识 传播 的 主 


点 ”由 科学 文献 或 者 相关 概念 事物 (知识 要 素 、 知 识 
单元 等 ) 表 征 ,“ 边 "通过 “知识 节点 ”之 间 的 某 种 关联 
关系 ( 共 现 .引用 和 因果 等 关系 ) 进行 联系 。 概 括 来 
讲 , 众 多 学 者 以 定量 化 知识 化 和 网 络 化 的 视角 探索 客 
观 科学 知识 网 络 ,通过 分 析 科 学 知识 网 络 从 而 研究 揭 
示 知 识 扩散 、 知 识 传递 等 现象 的 客观 规律 

目前 ,学 者 的 研究 主要 通过 分 析 微 观 视角 下 科学 
文献 之 间 的 引用 关系 探索 知识 扩散 ,但 由 于 知识 单元 
都 不 是 以 完全 孤立 与 游离 的 状态 存在 ,而 是 基于 关联 
关系 呈现 出 一 定 的 团 篮 性 与 集群 性 (社区 ) ,通过 微 视 
角 下 的 科学 文献 引用 关系 探索 知识 扩散 (知识 扩散 速 


o 


要 载体 ,通过 作者 的 引用 合作 等 关联 关系 形成 纽带 构 
成 科学 知识 网 络 , 随 着 时 间 的 推移 ,科学 文献 及 其 关联 
不 断 增多 ,承载 的 知识 不 断 传递 与 扩散 。 探 索 科 学 文 
献 网 络 时 序 变 化 的 基本 过 程 , 揭 示 科 学 知识 传播 规律 ， 
为 科学 技术 决策 提供 参考 依据 ,对 促进 科技 创新 具有 
重要 的 意义 。 近 年 来 ,科学 知识 网 络 的 扩散 演化 相关 
研究 成 为 图 情 领 域 学 者 关注 的 重点 之 一 ,其 中 “知识 节 


度 广度 等 ) , 便 无 法 有 效 揭示 知识 扩散 过 程 中 的 集群 
(社区 ) 时 序 变化 机 理 ,所 以 对 于 集群 (社区 ) 维 度 下 的 
知识 扩散 研究 有 待 深化 。 笔 者 尝试 探索 并 揭示 科学 知 
识 网 络 扩 散 过 程 中 ,引文 网 络 社区 的 扩张 与 收敛 模式 
与 特征 ,从 而 拓展 、 深 化 科学 知识 网 络 的 扩散 \ 传 递 相 
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2 文献 综述 


2.1 ”科学 知识 扩散 
目前 研究 者 将 引文 网 络 和 合作 网 络 作为 知识 扩散 
研究 的 主要 载体 ,以 定量 化 .网 络 化 和 知识 化 的 视角 探 
索 客观 科学 知识 网 络 扩散 ,揭示 显 隐 性 知识 的 扩散 、 传 
递 等 现象 的 客观 规律 ,产生 了 大 量 优秀 研究 成 果 。 
印 均 平等 ， (2014) 在 构建 国内 知识 图 谱 领 域 引文 
网 络 的 基础 上 ,从 网 络 中 文献 的 期 刊 .机 构 、 作 者 .关键 
词 4 个 层面 进行 整合 . 细 化 引文 网 络 ,并 引入 时 间 维度 
进行 分 析 以 揭示 知识 的 扩散 与 演进 过 程 , 发 现 国内 知 
识 图 谱 研究 由 科技 管理 领域 扩散 到 图 书 情报 领域 , 进 
而 推广 应 用 于 教育 学 等 学 科 领 域 。 李 纲 等 后 (2017) 引 
入 终 杂 网 络 和 超 图 数学 理论 构建 了 一 种 基于 科研 合作 
超 岗 络 的 知识 扩散 演化 模型 ,以 探究 科研 合作 网 络 中 
知识 扩散 的 演化 规律 和 动力 机 制 ;并 且 通 过 再 现 真实 
的 网 络 组 织 知识 传播 行为 ,揭示 了 科研 合作 网 络 中 不 
同 殉 络 结构 特征 ` 结 点 偏好 性 选择 .知识 增长 老化 以 及 
短 误 扩散 途径 与 知识 传播 扩散 过 程 的 动态 关系 。 岳 增 
EER] (2019) 以 社会 网 络 领域 为 例 分 析 了 学 科 引证 网 
颖 知识 扩散 特征 ,具体 以 文献 引证 作为 学 科 知识 传播 
路 鲍 载 体 ,从 集中 趋势 .离散 程度 和 分 布 形态 3 方面 对 
学 得 知识 扩散 中 介 性 特征 以 及 中 间 人 角色 特征 进行 剖 
析 5 茹 果 表 明 社 会 网 络 领域 学 科 间 的 知识 交流 活动 频 
华科 知识 扩散 数量 特征 指数 波动 范围 较 大 ,离散 程 
度 狗 高 ,分 布 多 呈现 长 尾 偏 右 的 尖顶 曲线 。 科 学 知识 
扩散 基本 规律 研究 一 直 是 图 书馆 学 、 情 报 学 学 者 关注 
的 事 要 问题 之 一 ,但 是 目前 的 研究 侧重 于 通过 微 视角 
下 的 科学 文献 引用 关系 探索 知识 扩散 (知识 扩散 速度 、 
广度 等 ) ,知识 扩散 过 程 中 的 集群 (社区 ) 时序 变化 机 
理 相关 研究 有 待 深化 。 
2.2 ”科学 知识 增长 自 组 织 机 制 

科学 知识 增长 问题 一 直 是 情报 学 、 科 学 学 等 学 科 
领域 学 者 研究 的 重要 问题 之 一 ,目前 研究 结果 表明 , 随 
着 时 间 的 推移 各 个 学 科 领 域 的 科学 知识 增长 具备 自 组 
织 特性 。 

其 中 代表 性 成 果 主 要 有 ,E. C. M. Noyons ex 
(1998) 在 研究 中 指出 科学 技术 发 展 过 程 中 ,科学 认 知 
系统 通过 科学 知识 的 自 组 织 推动 科学 知识 的 动态 增长 
与 老化 。 此 外 ,关于 科学 知识 增长 的 本 质问 题 , 有 的 学 
者 从 社会 学 术 交 流 角度 进行 探索 ,如 L. Leydesdorff 
等 中 (2003) 认 为 科学 知识 增长 的 本 质 是 一 个 科学 社会 
内 部 的 自 组 织 过 程 ,在 具体 研究 中 将 整个 科学 界 所 有 


学 科 看 作 是 一 个 大 系统 ,而 每 一 学 科 看 作 是 整个 科学 
大 系统 中 的 子 系统 ““" ,借鉴 系统 论 动力 学 的 思想 来 
研究 科学 知识 的 动态 增长 规律 ,通过 研究 表明 ,科学 研 
究 活动 通过 社会 化 的 学 术 交 流 来 获得 知识 的 积累 与 增 
长 ;有 的 学 者 从 科学 哲学 角度 探讨 科学 增长 问题 ,如 
K. Popper * (2007 ) 在 古典 的 经 验 主义 、 理 性 主义 和 批 
判 理性 主义 等 方法 论 基础 上 ,指出 科学 始 于 问题 ,科学 
理论 就 是 对 科学 问题 的 试探 性 答复 ,科学 发 展 是 一 个 
从 问题 到 问题 的 链 式 过 程 , 通 过 对 先前 知识 的 修改 而 
获得 新 的 知识 ,促进 科学 知识 增长 ,这 种 “ 链 式 ”结构 
使 得 科学 知识 增长 具备 自 组 织 特性 ;还 有 的 学 者 从 让 
辑 学 角度 探讨 科学 知识 增长 问题 ,如 靖 继 鹏 、 马 费 成 
等 " (2009) 认为 科学 是 一 个 不 稳定 的 逻辑 混乱 系统 中 
通过 逻辑 合理 化 组 织 来 获得 的 稳定 有 序 性 建构 ,通过 
知识 的 自 组 织 促进 科学 系统 的 有 序 化 ,推动 科学 知识 
的 增长 。 在 情报 学 领域 中 ,学 者 主要 通过 科学 文献 研 
究 科 学 知识 增长 问题 ,如 刘 则 渊 等 "(2012 ) 基于 科技 
文献 数据 ,利用 共 被 引 分 析 、 共 词 分 析 和 可 视 化 分 析 等 
文献 计量 学 方法 来 分 析 科学 知识 结构 的 动态 演化 过 
程 ,并 在 研究 中 指出 科学 发 展 过程 中 会 发 生 科学 知识 
单元 的 分 解 和 会 聚 .离散 和 重组 、 演 进 和 升华 .衍生 和 
转化 ,形成 一 个 从 简单 到 复杂 、 从 低级 到 高 级 、 从 混沌 
到 有 序 的 自 组 织 系统 ;万 昊 "(2017 ) 认为 随 着 系统 论 
的 思想 被 引入 科学 计量 学 领域 ,科学 知识 增长 问题 在 
系统 论 的 框架 有 了 新 的 阐述 , 即 科 学 知识 增长 过 程 中 
通过 逻辑 合理 化 组 织 以 获得 稳定 有 序 的 网 络 结构 。 

科学 知识 增长 的 自 组 织 特性 在 微观 层级 上 导致 离 
散 知识 单元 析出 ,游离 并 重组 、 更 新 ,进而 形成 知识 单 
元 的 科学 知识 网 络 结构 。 由 于 知识 单元 都 不 是 以 完全 
孤立 与 游离 的 状态 存在 ,而 是 基于 关联 关系 呈现 出 一 
定 的 团 徐 性 与 集群 性 (社区 ) ,科学 知识 网 络 扩散 中 伴 
随 着 社区 结构 的 扩张 与 收敛 现象 。 

2.3 ”知识 网 络 社区 演化 

学 科 领 域内 部 知识 单元 都 不 是 以 完全 孤立 与 游离 
的 状态 存在 ,而 是 基于 显 隐 性 关联 关系 呈现 出 一 定 的 
团 徐 性 与 集群 性 ,一 些 学 者 尝试 探索 科学 知识 生长 
过 程 中 的 知识 团 复 性 与 集群 性 演化 机 理 ”) 。 

其 中 ,复杂 网 络 社 区 这 一 概念 的 提出 有 效 推动 了 
知识 网 络 社区 演化 有 关 研 究 。M. Girvan 等 (2002) 
提出 了 社区 结构 (community structure ) 概念 ,把 社区 界 
定 为 复杂 网 络 中 的 一 个 子 图 . 子 网 络 ,基本 特征 为 社区 
内 部 节点 间 链 接 紧 密 , 不 同 社区 间 链 接 稀 朴 , 并 指出 网 
络 社 区 ( network community ) 或 网 络 团 复 结构 (network 
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cluster) 是 复杂 网 络 最 普遍 和 最 重要 的 拓扑 结构 属性 
之 一 ,在 此 基础 上 图 情 领 域 学 者 对 复杂 网 络 社区 演化 
EFT KER, HEW, M. A. Bettencourt ams] 
(2009) 基于 网 络 密度 直径 .连通 性 等 指标 揭示 知识 网 
络 社区 的 时 序 演 化 过 程 ,研究 中 指出 一 个 领域 从 产生 
到 成 熟 ,可 以 理解 为 作者 们 在 初期 进行 离散 的 孤立 的 
研究 ,之 后 逐渐 交融 形成 统一 认识 的 过 程 ; 白 如 江 09 
(2013) .王晓光 ' ”1 (2013) 等 通过 分 析 知识 网 络 社区 的 
演化 情况 ,挖掘 、 揭 示 相 关 领 域 研究 主题 的 发 展 趋 势 ; 
滕 广 青 “” (2018) 以 知识 间 关联 关系 为 基础 ,从 频 度 、 
关联 ,数量 ,规模 ,时序 多 个 维度 进行 交叉 复 现 分 析 , 对 
社会 化 标注 模式 下 Folksonomy 知识 组 织 模式 中 领域 知 
识 群落 的 生长 展开 研究 ,研究 指出 知识 群落 生长 模式 与 
规律 的 揭示 ,有 助 于 从 知识 间 的 互 促 互 扰 关 系 方面 拓展 
领域 知识 组 织 视野 并 把 握 知 识 发 展 的 脉络 。 
入- 知识 网 络 社区 演化 相关 研究 是 复杂 网 络 思维 下 对 
利于 知识 生长 规律 研究 的 拓展 深化 ,特别 是 数据 科学 
时 塔 背 景 下 科学 文献 爆发 式 增长 ,科学 知识 联系 愈 发 
紧密 ,针对 知识 网 络 结构 关系 (网 络 社区 , 团 徐 性 与 集 
群 候 ) 的 时 间 序 列 分 析 , 更 有 助 于 揭示 知识 发 展演 化 过 
E .融合 等 现象 背后 的 规律 。 
科学 知识 在 科学 共同 体 中 的 扩散 
- T. S. Kuhn 在 《科学 革命 的 结构 ) 一 书 中 提出 科学 发 
展 模式 理论 ,以 范式 为 核心 概念 ,认为 科学 发 展 是 一 个 
种 村 范式 不 断 变 迁 的 过 程 并 永 无 止境 不 断 发 展 ,并 将 科 
学 湾 式 "定义 为 “ 某 一 学 科 领 域 共同 体 的 共同 约定 ”。 
“三 D. J. Price 以 “无 形 学 院 "这 一 概念 来 指 那些 从 正 
式 的 学 术 组 织 中 派生 出 来 的 非 正 式 学 术 群 体 (科学 共 
同体 ) ,研究 中 探索 科学 内 部 的 社会 结构 与 科学 知识 增 
长 的 关系 , 即 学 科 或 专业 的 社会 组 织 与 知识 增长 的 关 
系 ,并 以 学 术 期 刊 为 例 对 1650 年 - 1950 年 的 学 术 期 刊 
数量 增长 规律 进行 研究 ,提出 了 文献 指数 增长 规 
fgt-ms D. Crane f£ T. S. Kuhn 的 科学 发 展 范式 理 
it .科学 共同 体 学 说 和 D. J. Price 的 无 形 学 院 .科学 知 
识 增长 定量 研究 基础 上 ,通过 学 术 论文 引证 关系 分 析 
了 科学 家 之 间 的 联系 ,目的 是 通过 具体 可 察 的 数据 资 
料 来 说 明科 学 家 之 间 的 种 种 非 正式 的 不 国定 的 社会 联 
系 以 及 各 个 学 科 领 域 中 的 “无 形 学 院 "的 存在 ,并 分 析 
了 科学 知识 和 科学 共同 体 在 科学 文献 增长 曲线 不 同 阶 
段 的 特征 ,具体 内 容 见 表 1。 

由 表 1 分 析 可 知 ,科学 知识 增长 .扩散 过 程 中 与 科 
学 共同 体 (社区 、 社 群 .群落 ) 密切 相关 。 在 阶段 1 中 ， 
新 范式 出 现 吸引 部 分 科学 家 ,科学 共同 体 (社区 , 社 群 、 


表 1 科学 知识 和 科学 共同 体 在 不 同文 献 增长 阶段 的 特征 


名 称 阶段 1 阶段 2 阶段 3 阶段 4 
知识 特征 范式 出 现 。 常规 科学 ”重大 问题 的 解决 E 
反复 出 现 危机 
科学 共同 体 特征 ”社会 组 织 少 ”合作 者 群体 ”日 益 专业 化 成员 减少 
或 无 或 无 形 学 院 ”争论 日 益 加 剧 。 成 员 减 少 


群落 ) 特 征 不 明显 ;在 阶段 2 中 , 随 着 研究 的 深入 ,科学 
知识 增长 .扩散 吸引 大 量 科 学 家 形成 科学 共同 体 ( 社 
区 社 群 .群落 ) ;在 阶段 3 中 , 随 着 研究 愈 发 深入 ,呈现 
日 益 专业 化 特征 ,科学 共同 体 (社区 、 社 群 . 群 落 ) 趋 于 
稳定 ;在 阶段 4 中 ,由 于 科学 的 发 展 ,部 分 研究 衰退 , 科 
学 共同 体 (社区 , 社 群 群落) 成 员 减 少 ,科学 知识 发 展 
衰退 特征 显著 。D. Crane 关于 知识 在 科学 共同 体 中 扩 
散 的 研究 ,对 于 目前 科学 知识 扩散 有 关 人 研究 具有 理论 
HIER C ;此 外 , 随 着 近年 来 复杂 网 络 分 析 技 术 与 方法 
的 发 展 ( 如 网 络 社区 探测 . 聚 类 算法 和 网 络 表示 学 习 
等 ) ,以 及 科学 文献 数据 的 爆发 式 增 长 ,可 知 关 于 科学 
知识 网 络 中 社区 (社区 、 社 群 、 群 落 ) 发 展 过 程 中 的 扩 
张 收敛 时 序 演变 问题 ,在 研究 理论 、 人 研究 数据 和 研究 
技术 方法 3 个 方面 都 具备 展开 研究 的 基础 。 

综 上 所 述 ,笔者 在 T.S. Kuhn 的 科学 发 展 范 式 理 
论 与 科学 共同 体 学 说 、D.J. Price 的 科学 知识 增长 定量 
研究 基础 上 ,综合 D. J. Price 关于 无 形 学 院 的 相关 研 
究 , 以 复杂 网 络 思维 为 指导 ,从 科学 知识 扩散 角度 切 
入 ,探索 科学 知识 扩散 过 程 中 的 群 聚 性 问题 和 科学 知 
识 扩散 过 程 中 的 群 聚 性 问题 ,对 科学 知识 网 络 中 社区 
(社区 、 社 群 群 落 ) 发 展 过 程 中 的 扩张 .收敛 时 序 演变 
过 程 进行 动态 跟踪 建 模 ,从 而 揭示 科学 知识 网 络 时 序 
变化 过 程 中 社区 扩张 与 收敛 的 基本 模式 与 规律 ,以 期 
为 知识 扩散 相关 研究 提供 有 益 的 研究 视角 。 
3 ”研究 设计 
3.1 研究 数据 

笔者 以 PubMed 数据 库 所 收录 的 “医疗 健康 信息 ” 
领域 的 文献 数据 为 研究 数据 ,具体 检索 策略 是 选择 
PubMed 数据 库 为 检索 数据 库 , 以 “medical/health infor- 
matics/ information" 为 检索 词 进行 题名 检索 ,发 文 年 代 
范围 不 限 ,具体 检索 式 为 (((medical information [ Ti- 
tle] ) OR health information[ Title] ) OR health informat- 
ics[ Title] ) OR medical informatics [ Title] AND “ NIH 


grants" [ Filter] 。 


以 检索 结果 为 领域 核心 文献 ,导出 PMID ,然后 基 
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T OR FERITI OUER S 5| C , 2545-81] 1981 年 
- 2019 年 间 发 表 的 5 643 篇 文献 ,然后 以 这 些 文献 的 
PMID 号 (在线 检索 工具 :https://www. ncbi. nlm. nih. 
gov/ sites/ batchentrez ) 检索 下 载 相 应 题 录 数 据 保存 至 本 
地 以 备 后 续 研 究 。 由 于 研究 数据 时 间 跨 度 较 大 ,为 了 
有 效 揭示 知识 扩散 过 程 中 的 社区 扩张 与 收敛 模式 ,所 
以 对 其 进行 时 间 段 划分 ,具体 将 1981 年 -2019 年 划分 
为 8 个 时 间 段 (对 应 8 个 时 期 ) ,由 于 研究 数据 时 间 跨 度 
近 40 年 ,并 且 在 早期 1981 年 - 2000 年 文献 数量 较 少 ,如 
果 严 格 按照 自然 年 份 等 距 划分 时 期 会 导致 前 几 个 时 期 
与 后 几 个 时 期 相差 过 于 悬殊 不 利于 后 续 模 型 的 构建 ， 
此 笔者 灵活 划分 时 间 窗 口 ,以 保证 各 个 时 期 的 文献 数量 
不 会 相差 过 大 ,并 且 符 合 科学 文献 增长 规律 ( 即 普 莱 斯 
区 缺 指数 增长 规律 ) ,从 而 保证 后 续 研究 的 科学 性 有效 
性 各 个 时 期 文献 数量 分 布 情况 如 图 1 所 示 : 


0 
1981-1995 1996-1999 2000-2008 2004-2006 2007-2009 2010-2012 2013-2015 2016-2019 
时 间 (年 ) 


1 文献 数量 时 期 分 布 


3M 研究 方法 与 流程 
人 本 研究 的 基本 目标 是 基于 文献 引用 数据 对 科学 知 
识 搓 散 中 的 社区 扩张 与 收敛 时 序 变化 现象 进行 客观 测 
度 现 分 析 , 并 尝试 通 过 数学 模型 总 结 归纳 出 社区 扩张 
与 收敛 时 序 变化 现象 后 面 隐 含 的 固有 模式 与 规律 。 

围绕 研究 目标 ,提出 研究 方法 与 基本 流程 :首先 基 
于 文献 引用 关系 建立 矩阵 进而 构建 学 科 知识 网 络 , 采 
用 复杂 网 络 分 析 中 的 Louvain 社区 探测 算法 对 领域 知 
识 网 络 进行 划分 ,然后 利用 网 络 表示 学 习 技术 (graph 
embedding) 进行 社区 扩张 与 收敛 特征 表示 与 计算 ,并 
以 时 间 序 列 为 逻辑 线索 ,对 科学 知识 网 络 中 社区 ( 社 
群 .群落 ) 的 扩张 .收敛 演变 过 程 进行 动态 跟踪 建 模 ,从 
而 揭示 科学 知识 网 络 时 序 扩散 变化 过 程 中 社区 扩张 与 
收敛 的 基本 模式 与 规律 ,下 面 对 主 要 研究 方法 流程 进 
行 分 析 。 
3.2.1 科学 知识 网 络 构建 

笔者 将 科学 知识 网 络 定义 为 描述 科学 文献 ( 节 
点 ) 及 其 引用 关系 ( 边 ) 按 照 时 间 顺 序 相互 作用 的 数据 
结构 模型 。 从 可 视 化 层面 讲 , 即 节点 (文献 ) 及 其 边 


(引用 关系 ) 随 着 时 间 推 移 不 断 变化 构成 的 图 Gt = 
(Vt, Et) ,表示 在 任意 时 间 段 L0, n] (0 S t E n) fl 
学 知识 网 络 集合 。 

科学 知识 网 络 构建 是 进行 后 续 研 究 的 基础 ,为 了 
实现 科学 知识 网 络 社 区 扩张 与 收敛 模式 分 析 , 需 要 实 
现 对 不 同时 间 窗 口 的 科学 知识 网 络 进行 动态 分 析 , 本 
文中 科学 知识 网 络 构建 可 以 概括 为 以 下 两 个 子 步 又 : 

(1) 科 学 知识 网 络 是 一 个 增长 型 网 络 ,为 了 对 科 
学 知识 网 络 中 社区 ( 社 群 .群落 ) 的 扩张 .收敛 演变 过 
程 进行 动态 跟踪 建 模 , 因此 需要 按照 年 度 划分 时 间 段 
T-2iu-0,2-0,--- ,in- tmi ,n «m, 

(2) 根 据 上 一 步 划 分 的 时 间 段 T= {t1 - 02,0 - 
Bue ,tn - tm] 2) 31 E T 5| HAS RA EE SCA 5| HEAR. 
阵 ,进而 建立 不 同时 期 的 科学 知识 网 络 G4 = 16,,G,, 
n eie 6,1 ,为 后 续 研 究竟 定数 据 基 础 。 

不 同时 期 的 科学 知识 网 络 构建 采用 时 间 切 片 的 方 
法 (也 可 称 半 累 积 科 学 知识 网 络 ” ) ,是 指 在 所 分 析 的 
时 间 段 中 引文 网 络 由 两 部 分 组 成 :中 该 时 间 段 内 发 表 
的 文献 ( 施 引文 献 ) ;@ 这 些 文献 所 引用 的 本 时 间 段 以 
及 之 前 所 有 时 间 的 文献 (被 引文 献 ) 。 如 果 分 析 全 累 
计 的 引文 网 络 , 则 过 去 引文 信息 的 积累 很 容易 淹没 当 
前 文献 所 揭示 的 社区 ,所 以 ,笔者 通过 构建 不 同时 间 段 
的 引文 网 络 切片 以 有 效 探索 .揭示 知识 扩散 过 程 中 社 
区 时 序 演变 情况 。 

3.2.2 基于 Louvain 算法 的 社区 探测 

笔者 利用 Louvain 算法 “进行 社区 探测 ,Lou- 
vain 算法 是 基于 模块 度 (modularity ) 的 社区 发 现 算法 ， 
可 以 有 效 探 测 层次 性 社区 结构 ,模块 度 是 目前 评价 社 
区 探测 结果 的 主要 指标 ,模块 度 越 大 意味 着 社区 发 现 
的 效果 越 好 。 

模块 度 这 一 概念 由 M. E. Newman 4$ 7" (2004) 首 
次 提出 ,并 受到 了 复杂 网 络 领域 学 者 的 关于 与 认可 ,以 
之 为 基础 提出 了 众多 社区 探测 算法 ,其 中 Louvain 算法 
是 代表 成 果 之 一 。Louvain 算法 在 效率 和 效果 上 都 表 
现 比较 好 ,主要 有 易于 理解 . 非 监督 和 计算 快速 等 优 
点 ,其 中 ,目前 Python 环境 下 的 NetworkX 工具 包 和 复 
杂 网 络 分 析 软 件 Cephi 中 都 集成 了 Louvain 算法 功能 。 
具体 利用 Louvain 算法 识别 每 个 时 间 窗 口内 的 知识 社 
区 ,可 以 细 分 为 原始 划分 、 模 块 度 优化 .社区 聚合 和 社 
区 探测 4 个 步骤 。 其 中 ,关键 步骤 为 模块 度 优化 ,模块 
度 计 算 方法 如 公式 (1)5 所 示 : 


zd oL e 
075 ij ^m i 


公式 (1) 
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络 扩 散 中 的 社区 扩张 与 收敛 模式 特征 分 析 


以 医疗 健 碌 入 hingxivgg A ERES H 


其 中 ,@ 代表 模块 度 ;4; 表 示 复 杂 网 络 中 1 和 j 之 
间 边 的 权重 ;k;, k; 表示 与 节点 i 和 j 相连 的 所 有 边 的 
权重 之 和 ;ce;, c; 表示 节点 1 和 j 的 所 属 社区 , 当 i 和 j 
属于 同一 社区 (c, 6) =1, 不 属于 同一 社区 时 等 于 0; 
Q 的 最 大 值 为 1, Q 越 接 近 这 个 值 ,就 说 明 社 区 结构 越 
明显 。 
3.2.3 基于 Graph Embedding 的 社区 扩张 与 收敛 特 
征 表 示 与 计算 

传统 经 典 社会 网 络 分 析 方 法 ( 度 、 中 心性 和 密度 
等 ) 无 法 有 效 测度 引文 网 络 中 社区 的 扩张 与 收敛 特 
征 , 随 着 深度 学 习 技 术 的 快速 发 展 , 网 络 表示 学 习 法 
( Graph Embedding Method , GEM ) , tE ff KI ic A CES 
点 表示 为 实数 值 向 量 , 同 时 保持 网 络 结构 和 节点 固 
T 性 的 方法 ,利用 深度 学 习 算 法 自动 提取 每 个 网 

点 的 特征 ,并 形成 embedding 能 入 ), 是 从 

Wad2vee 等 ”” 发 展 而 来 的 Embedding 技术 的 最 新 
AERE 近年 来 在 推荐 系统 .计算 广告 领域 应 用 广泛 ， 
Je». Deepwalk , LINE , Node2vec 等 是 比较 有 代表 性 的 


D] 


Jak. 
中 笔者 尝试 利用 网 络 表示 学 习 技术 以 更 好 地 测度 
社区 扩张 与 收 合 特 征 ,研究 中 使 用 斯 坦 福 大 学 开源 
ifENode2vec 进行 社区 扩张 与 收敛 寺 征 表示 与 计算 。 
Nb. 是 将 网 络 中 的 节点 表征 为 实数 值 向 量 的 算 
法 模型 ,其 利用 深度 学 习 的 思想 ,可 以 通过 一 个 三 层 
神 蜂 网 络 (输入 层 - 隐藏 层 -输出 层 ) 把 每 个 节点 喘 
IR K 维 实数 向 量 ,将 网 络 中 任意 两 个 节点 的 相关 
关 么 ,转换 为 对 应 两 个 向 量 的 相关 关系 ,利于 计算 存 
储 6 乐 用 再 手动 提 特 征 ( 自 适 应 性 ) ,其 中 ,Node2vec 
通过 定义 一 个 目标 函数 f(u) 来 表示 学 习 节 点 的 局 部 
eo gi de 者 构 相 似 的 节 

学 习 得 到 相近 特征 ,该 目标 函数 如 公式 (2)52 所 
ZN: 


Network data 


Node2vec+T-SNE 


fCu) = max, Y Jog PCN, Qu) lu) ) 
| E 公式 (2) 


P(N,(u)lf(u) x Jl, P(neM(u)) 
HE fu) IT E u BRUST JJ embedding 向 量 的 目 
标 函 数 ;V 表示 网 络 中 节点 的 集合 ,S 指 得 到 节点 邻居 
N 的 策略 ,Ns(u) 表 示 通 过 采样 策略 S 采样 出 的 节点 
的 近邻 顶点 集合 ,Node2vec 模型 算法 如 图 2 所 示 : 


Algorithm 1 The node2vec algorithm. 
LearnFeatures (Graph G = (V, E, W), Dimensions d, Walks per 
node r, Walk length /, Context size k, Return p, In-out q) 
7 — PreprocessModifiedWeights(G, p, q) 
G' = (V, E,n) 
Initialize walks to Empty 
for iter — 1tor do 
for all nodes u € V do 
walk = node2vecWalk(G",, u, l) 
Append walk to walks 
f = StochasticGradientDescent(k, d, walks) 
return f 


node2vecWalk (Graph G” = (V, E, 7), Start node u, Length 1) 
Inititalize walk to [u] 
for walk iter = 1 to l do 
curr = walk[—1] 
Veurr = GetNeighbors(curr, G^) 
s = AliasSample(Veurr, T) 
Append s to walk 
return walk 


2 Node2vec 模型 算法 


本 研究 主要 利用 Python 语言 进行 社区 扩张 与 收敛 
特征 表示 与 计算 ,在 具体 处 理 步骤 中 ,首先 基于 
Node2vec 模型 算法 (https://github. com/ aditya-grover/ 
node2 vec ) 将 引文 网 络 中 的 每 个 节点 表示 成 可 计算 的 开 
维 向 量 ,然后 结合 上 一 步 中 的 社区 划分 结果 ,计算 各 个 
社区 节点 (向 量 ) 之 间 的 距离 进而 可 得 社区 所 占 区 域 

面积 的 大 小 (以 各 个 社区 内 节点 最 大 距离 为 区 域 直 
径 ) ,然后 通过 分 析 各 个 社区 在 不 同时 间 段 的 区 域 面积 
时 序 变 化 情况 ,从 而 表征 与 测度 引文 网 络 时 序 变化 过 
程 中 社区 的 扩张 与 收敛 情况 ,基本 思路 可 归纳 概括 为 
如 图 3 所 示 : 


Expansion and Convergence 


Calculation 


图 3 基于 Graph Embedding 的 社区 扩张 与 收敛 特征 计算 基本 思路 


3.2.4 社区 扩张 与 收敛 模型 构建 与 模式 分 析 

最 后 ,以 时 间 序 列 ( 划 分 的 时 间 窗 口 ) 为 逻辑 线 
索 , 对 科学 知识 网 络 中 社区 ( 社 群 群落 ) 的 扩张 .收敛 
演变 过 程 进行 动态 跟踪 、 拟 合 建 模 ,从 而 对 科学 知识 网 


络 时 序 扩散 变化 过 程 中 社区 扩张 与 收敛 现象 进行 分 
析 , 并 尝试 归纳 其 基本 模式 ,具体 可 以 分 为 2 个 子 步 


IR: 


(1) 在 对 社区 扩张 与 收敛 时 序数 据 进行 拟 合 之 
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前 ,首先 根据 上 一 步 计 算得 到 的 社区 扩张 与 收敛 特征 
计算 结果 的 时 序数 据 绘制 变化 趋势 图 (折线 图 . 散 点 图 
等 ) ; 

(2) 然 后 ,通过 观察 时 序数 据 可 视 化 结果 来 分 析 
社区 时 序 变化 特征 ,以 确定 应 该 使 用 何 种 函数 曲线 进 


LLL E? 


(1) SHE y=ax (2) 指数 函数 


K 
P y 
b>0 b<0 
x 


(4) 对 数 函 数 y—acblnx 


二 00172v1 


通过 上 述 方法 步骤 的 处 理 分 析 , 对 科学 知识 扩散 
Vic s 与 收敛 时 序 变化 现象 进行 了 客观 测度 和 
, 即 基于 科学 文献 之 间 的 引用 关系 揭示 了 中 观 视 
HEDGE) 的 知识 扩散 规律 ,并 通过 科学 的 数学 模型 
总 席 归 纳 出 社区 扩张 与 收敛 时 序 变 化 现象 背后 隐 含 的 
固 消 模式 ,对 于 拓展 ,深化 科学 知识 网 络 的 扩散 .传递 
egisti 一 定 的 理论 与 实践 意义 。 


ASIE AM 


5 科学 知识 网 络 构建 与 社区 探测 
根据 研究 方法 中 提出 的 流程 步骤 ,分 别 构建 “ 医 


1 Period (1981-1995) 2 Period (1996-1999) 


(5) S 形 曲线 函数 y= 


图 4 目前 典型 的 拟 合 


, 即 确定 拟 合 的 函数 模型 类 别 。 
目前 典型 的 拟 合 函 数 模型 主要 有 指数 函数 、 震 函 
数 、 双 曲线 函数 .指数 函数 和 S 形 曲 线 函 数 等 ,基本 公 
式 与 函数 图 像 如 图 4 所 示 : 


行 拟 合 


(3) MHS 


p=a 


x 


a+be™ 


疗 健康 信息 (health informatics ) " 领域 8 个 时 期 的 初 
台 引 文 网 络 ; 然 后 ,利用 Louvian 算法 对 初始 引文 网 
络 进 行 社区 探测 操作 ,对 输入 的 文献 引用 数据 进行 
模块 化 分 析 ,将 初始 模块 分 割 参数 (resolution ) 设置 为 
默认 值 5 ,并 根据 实际 划分 结果 对 各 个 时 期 的 resolu- 
tion 值 进行 微调 以 提高 社区 探测 结果 准确 性 ,最 终 获 
得 各 个 时 期 的 社区 探测 结果 ,各 个 时 期 的 引文 网 络 
社区 探测 结果 如 图 5 所 示 ,节点 大 小 正比 于 中 心性 ， 
布局 方式 (layout ) 2& JH FR ( Fruchterman Reingold ) 
布局 。 


f sli N 


3 Period (2000-2003) 4 Period (2004-2006) 


5 Period (2007-2009) 


6 Period (2010-2012) 


图 5 


7 Period (2013-2015) 8 Period (2016-2019) 


各 个 时 期 社区 探测 结果 
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5 表示 8 个 时 期 的 初始 引文 网 络 , 展 现 了 各 个 
时 期 初始 引文 网 络 的 社区 探测 结果 , 即 通过 文献 节点 
的 联系 和 聚集 紧密 程度 来 揭示 社区 结构 。 分 析 图 5 可 
知 , 随 着 时 间 的 推移 ,医疗 健康 信息 领域 初始 引文 网 络 
不 断 生 长 ,并 且 各 个 时 期 引文 网 络 都 呈现 出 清晰 的 社 
结构 ,在 引文 网 络 社区 时 序 演变 过 程 中 表现 出 一 定 
的 社区 规模 的 扩张 与 收敛 现象 ,下 面 继续 对 其 进行 进 
一 步 的 揭示 分 析 。 


4.2 基于 Node2vec 的 社区 扩张 与 收敛 特征 计算 结果 

在 上 一 步 社区 探测 结果 基础 上 ,结合 引文 网 络 数 
据 , 利 用 Node2vec 模型 算法 对 各 个 时 期 引文 网 络 进 行 
计算 从 而 提取 每 个 网 络 节 点 的 特征 ,将 节点 表示 为 
128 维 ( dimension ) 的 实数 值 向 量 ,从 而 得 到 各 个 时 期 
社区 节点 向 量 ( 见 表 2) , 表 中 社区 ID. 指 各 个 节点 所 属 
社区 ,PMID 表示 各 个 节点 的 PubMed 数据 库 中 的 唯一 
标识 号 ,dimn 表示 节点 的 n 维 实数 向 量 。 


表 2 各 个 时 期 社区 节点 向 量 (部 分 结果 ) 


社区 ID PMID diml dim2 dim3 


dim5 dim6 dim7 ^v Dim128 
社区 4 1 482 884 0.364 5 -0.1820 -0.045 9 0.173 1 0.468 9 0.090 2 0.1643 . --- -0.182 5 
社区 4 1 482 926 0.336 6 -0.261 7 一 0.093 4 0.186 0 0.416 4 0.120 1 0.1006 | esee -0.081 2 
社区 5 1 482 948 0.010 4 -0.139 5 -0.064 6 -0.227 2 0. 383 4 0. 024 4 -0.2152 — ess 0.218 2 
社区 4 1 482 993 0.3719 -0.2202 -0.078 8 0.198 7 0.494 0 0.099 8 0.1392 . ees -0.147 8 
Tx 3 1 537 018 0.2213 -0.445 8 0.070 1 0.276 4 0.470 5 0.535 8 -0.0853 ees 0.1322 
CNEE 4 1 582 194 0.378 9 -0.196 6 -0.027 1 0.190 6 0.558 5 0.096 2 0.1869 . ees -0.191 9 
Nir 5 1 807 576 -0.002 6 -0.142 3 -0.076 2 -0.244 4 0.398 1 0.019 9 -0.2346 — ees 0.239 1 
TEK 6 1 807 625 0.2703 -0.087 3 0.157 7 0.023 3 0.201 8 0.063 6 0.285 — een -0.305 5 
EL 5 1 807 701 0.006 9 -0.1517 -0.0725 -0.246 7 0.408 2 0.024 7 -0.2356 — ess 0.244 9 
TEIX 5 1 807 737 0.002 2 —-0.139 4 —0.069 6 一 0.243 4 0.372 5 0.017 3 -0.2277 — eese 0.224 5 
+ 区 5 1 807 738 0.0045 -0.144 0 -0.066 3 -0.226 8 0.390 2 0. 023 2 -0.2233 0.2302 


CO. 


后 将 各 个 时 期 的 社区 节点 向 量 用 T-SNE/" (T- 
DGBibution Stochastic Neighbour Embedding ) 映射 到 二 
Aiit ILC IHRE LEI 6). T-SNECT 分 布 随机 
近 于 和 入) 是 一 种 用 于 降 维 的 机 器 学 习 方法 ,能 帮助 识 


别 相 关联 的 模式 ,主要 的 优势 是 保持 高 维 数据 局 部 结 
构 的 能 力 , 即 高 维 数据 空间 中 距离 相近 的 点 投影 到 低 
维 中 仍然 相近 。 


x< TD) T-SNE node2vec T-SNE node2vec T-SNE node2vec T-SNE 
= e cle DA E : ERD D | e - 
1 Period ( 1981- 1995) 2 Period (1996-1999) 3 Period (2000-2003) 4 Period (2004-2006) 
Donee T-SNE node2vec T-SNE node2vec T-SNE node2vec T-SNE 
5 Period (2007-2009) 6 Period (2010-2012) 7 Period (2013-2015) 8 Period (2016-2019) 
6 各 个 时 期 社区 节点 特征 提取 及 其 T-SNE 可 视 化 
将 图 6 和 图 5 进行 对 比分 析 , 图 6 中 反映 的 社区 | 欧 氏 距离 指 在 n 维 空 


节点 聚集 和 分 布 情况 ,与 传统 经 典 社区 探测 结果 基本 
一 致 ,由 此 可 知 , 基 于 Node2vee 对 社区 节点 进行 特征 
提取 并 表示 为 向 量 , 能 够 有 效 揭 示 各 个 时 期 引文 网 络 
的 社区 结构 ,在 一 定 程度 上 说 明 ,通过 计算 社区 节点 向 
量 来 测度 社区 规模 的 大 小 是 可 行 有 效 的 。 因 此 ,利用 
各 个 时 期 社区 节点 向 量 结果 ,分 别 计算 社区 节点 之 间 
的 距离 (具体 使 用 欧 几 里 得 度量 euclidean metric ,也 称 


s 间 中 两 个 点 之 间 的 真实 距离 ) , 选 
取 社 区 节点 间 的 最 大 距离 ,以 之 为 直径 计算 各 个 社区 
区 域 面积 大 小 ,进而 可 以 对 不 同时 段 社 区 所 占 区 域 面 
积 大 小 进行 时 序数 据 构建 ,然后 在 后 续 步 又 中 通过 进 
行 数 学 建 模 以 有 效 测度 社区 规模 的 扩张 与 收敛 。 
4.3 医疗 健康 信息 领域 社区 扩张 与 收敛 时 序 分 析 
笔者 结合 全 时 期 网 络 节点 向 量 T-SNE 可 视 化 和 社 
区 规模 时 序 变化 数据 ( 见 图 7) ,对 医疗 健康 信息 领域 
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整体 规模 TOPS 的 热点 社区 (互联 网 健康 信息 、 健 康信 
息 行为 ,电子 健康 信息 系统 与 技术 、 健 康信 息 评估 和 健 


全 时 期 网 络 节点 向 量 T-SNE 


"us : 
"y ES È n n 
ilta eei 网 
区 2^ ^ Lu 
^. ^-^ 
*. mn e € 
* s a 


LM 
y~ 


> 

NG) g p fit e fo E EKA ER D pc 2 RAE 
使 健康 信息 的 获取 更 加 方便 快捷 ,公众 获取 健康 信息 
的 扫 段 不 仅仅 依赖 于 医院 .医生 ,而 是 逐步 转向 信息 获 

便 快捷 的 互联 网 平台 ,在 此 背景 下 促进 了 健康 服 

台 的 产生 和 发 展 ;公众 对 于 健康 信息 的 可 访问 性 
的 艳 响 因素 知之 甚 少 ,存在 着 信息 质量 差 、 使 用 一 级 搜 
地区 和 简单 搜索 术语 访问 健康 信息 效率 不 高 的 问 
题 和 如何 实 现 健康 信息 可 访问 性 、 提 高 检索 效率 也 是 研 
究 有 的 重 中 之 重 ; 此 外 ,大 数据 环境 下 公众 的 健康 信息 安 
会 恪 私 保护 等 问题 也 是 目前 研究 的 重点 内 容 。 根 据 
图 可 以 看 出 ,该 社区 在 前 5 个 阶段 社区 规模 呈现 平 
稳 季 发 展 趋 势 ,第 6 阶段 快速 上 升 到 峰值 ,第 7.8 阶段 

下 降 趋 势 , 该 趋势 反映 互联 网 健康 信息 为 健康 信 
息 领域 的 重点 及 热点 内 容 。 

(2) 健 康信 息 行为 。 公 众 健康 信息 需要 的 不 断 增 
长 促使 公众 获取 健康 信息 的 途径 逐渐 多 样 化 ,互联 网 
技术 及 移动 互联 网 技术 的 发 展 更 为 健康 信息 的 获取 提 
供 了 更 加 方便 快捷 有 效 的 方式 。 公 众 对 健康 信息 的 持 
续 关 注 促使 了 一 系列 健康 信息 行为 的 发 生 ,信息 检索 、 
信息 获取 等 信息 行为 以 及 信息 行为 的 影响 因素 逐渐 成 
为 研究 重点 。 根 据 图 7 可 以 看 出 ,该 社区 规模 时 序 变 
化 与 互联 网 健康 信息 基本 一 致 ,都 呈现 出 平稳 发 展 到 
快速 发 展 再 到 逐渐 下 降 的 趋势 ,是 健康 信息 领域 的 重 
点 及 热点 内 容 。 

(3 ) 电子 健康 信息 系统 与 技术 。 目 前 ,国外 对 于 
电子 健康 信息 系统 与 技术 的 建设 相对 成 熟 , 既 有 关于 
电子 健康 信息 系统 完善 的 构建 流程 的 概念 模型 ,促进 
健康 信息 技术 的 不 断 完善 和 发 展 ,也 有 能 够 用 于 实践 


康 管理 ) 进行 社区 规模 变化 趋势 解读 分 析 ,并 为 下 一 步 
的 社区 扩张 与 收敛 模型 构建 及 模式 分 析 黄 定 基础 。 
Top5 社 区 规模 时 序 变化 


1 互联 网 健康 信和 


1 2 9 «& $& & T8 
À 

— 2 健康 信息 行为 B 
$ A 

e P | d 
hd 7| 234 6 & t* 8 

— 3 电子 健康 信息 看 技术 


1 2 3 4 5 6 7.8 


d 4 健康 信息 评估 
rz á 


123456728 


5 健康 管理 
42 345.578 


7 全 时 期 网 络 节 点 向 量 T-SNE 可 视 化 与 TOPS 社区 时 序 变化 


的 完善 的 平台 和 系统 。 根 据 图 7 可 以 看 出 ,该 社区 在 
第 6 时 期 前 社区 规模 时 序 变化 呈现 平稳 的 发 展 趋 势 并 
在 第 6 时 期 后 逐步 上 升 ,反映 该 社区 逐渐 成 为 医疗 健 
康信 息 领 域 的 重点 研究 内 容 。 

(4) 健 康信 息 评 估 。 在 网 络 环境 下 公众 能 够 及 时 
便利 地 获取 相关 健康 信息 ,但 网 上 资源 质量 参差 不 齐 ， 
如 何 保证 健康 信息 的 质量 .实现 质量 控制 逐渐 成 为 研 
究 热点 ,因此 健康 信息 评 佑 的 相关 研究 逐渐 增多 。 关 
于 健康 信息 评估 目前 主要 集中 在 影响 健康 信息 的 因素 
与 评估 体系 的 构建 ,未 来 研究 更 加 侧重 于 技术 手段 实 
现 信 息 评价 。 根 据 图 7 可 以 看 出 ,该 社区 的 社区 规模 
时 序 变化 在 第 7 阶段 前 呈现 平稳 趋势 ,第 7 时 期 后 快 
速 发 展 ,反映 该 社区 将 在 未 来 几 年 内 成 为 健康 信息 领 
域 的 研究 热点 。 

(5 ) 健康 管理 。 随 着 近年 来 人 们 生活 方式 和 健康 
理念 的 转变 ,健康 管理 在 新 的 健康 模式 下 也 表现 出 了 
新 的 特点 ,逐渐 成 为 一 种 新 兴 的 健康 服务 理念 和 服务 
方式 。 在 此 背景 下 ,健康 管理 服务 的 发 展 带动 了 学 者 对 
健康 管理 服务 系统 的 研究 ,目前 主要 集中 于 以 下 3 个 方 
面 :中 以 各 类 疾病 的 治疗 为 核心 的 医疗 健康 管理 服务 系 
统 ;@) 健 康 管 理 服务 技术 ;(G@) 健 康 管 理 系统 或 体系 的 构 
成 。 根 据 图 7 可 以 看 出 ,该 社区 规模 时 序 变化 的 发 展 与 
健康 信息 相似 ,同样 具有 成 为 领域 研究 热点 的 潜力 。 
4.4 ”科学 知识 网 络 社区 扩张 与 收敛 模型 构建 及 模式 
分 析 

在 上 述 分 析 的 基础 上 ,对 社区 规模 时 序 变化 数据 
进行 拟 合 建 模 。 目 前 典型 的 拟 合 函 数 模 型 主要 有 指数 
函数 、 窒 函数 、 双 曲线 函数 指数 函数 和 S 形 曲 线 函 数 
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等 ,由 观测 研究 数据 (绘制 折线 图 ,观测 变化 趋势 ) 和 


io 


曲线 (文献 增长 规律 ) 可 知 ,科学 知识 网 络 中 社 


区 规模 时 序 变化 过 程 更 加 契合 S 形 曲 线 函 数 ( 其 中 代 


对 社区 扩张 与 收敛 时 序 变化 数据 进行 S 形 曲线 拟 合 以 


构建 数学 模型 ,结果 
康信 息 、 健 康信 息 
5 个 热点 社区 (整体 规模 TOP5 ) 模型 构建 结果 。 


如 图 8 所 示 , 图 中 展示 了 互联 网 健 


行为 和 电子 健康 信息 系统 与 技术 等 


X; QU Led entere " » . 3 
表 性 函数 Logistic 模型 ) ,因此 ,笔者 利用 S 形 曲线 函数 
260 
180] [Model BIH 1 240 ] | Model 
5 ^ : 
160 -| | Equation y P PLE ELE 220 | Equation 
2 200 
1404 |Plot 1 互联 网 健康 信息 | 159. Pet 
规 120] Pm 4559.92552 + 3.62111E9 | | PEL 
网 Ka 6.12558 土 -- | ij 
模 1004 |ki 3.78686 + 527692.72691 Li Ki 
80- |Ha 127.80848 + — | 120 |Ha 
eo] | 6.18146 + 787284304 | | 1004 Hi 
Reduced Chi-Sq 2.99566 4 80. | Reduced Chi-Sqr 
40 + |R-Square (COD) 0.99898 0] | R-Square (COD) 
20] |Adj, R-Square 0.99763 | 40 -| | Adj. R-Square 
20 
0 Li L] . LI a 0 * - 


Model 
Equation 
Plot 


Reduced Chi-Sqr 


R-Square (COD) 
Adj. R-Square 


Logistic 
y = A2 + (A1-A2)/(1 + (x/x0)^p) 
4 健康 信息 评估 
0.48856 + 0.54422 
18941.70902 + 2.3732E8 
12.94053 + 10751.37882 
15.12345 + 56.55518 
1.39422 
0.9635 
0.93613 
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Xiv 


时 间 


y= Pm/(1+(Kalx)*Ha)/(1+(X | 


2 健康 信息 行为 


BiHill 
Ki)^Hi); 


12295.95283 1 -- 
6.16929 1 -- 
4.50939 1 -- 
149.3585 x -- 
11.58066 t -- 

0.31734 
0.9998 
0.99953 
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-| | Equation 


Model BiHill 
y = Pmi(1*(Kab)^Ha)((1*(/ 
Ki)^Hi): 


3 电子 健康 信息 系统 与 技术 


Pm 31.87504 + 3.6667E7 
4 |Ka 6.32563 + 0.33898 
Ki 0.00343 + 320371.82707 
1 |Ha 15.25757 9.27676 
Jini 0.02463 + 14033.98716 
Reduced Chi-Sqr 0.06561 
-| |R-Square (COD) 0.99916 
Adj. R-Square 0.99805 
s 
Lj . . LJ a 


Model 
Equation 
Plot 


Reduced Chi-Sqr 
R-Square (COD) 
Adj. R-Square 


Logistic 


= A2 + (A1-A2)/(1 + (xIX0)^p) 


5 健康 管理 
0.39728 + 0.49346 
7183.17859 + 1.19792E8 
11.22673 + 9865.82231 
19.0771 + 180.20186 
1.18378 
0.95774 
0.92605 


图 8 TOPS 热点 社区 扩张 与 收敛 模型 构建 


由 图 8 可 知 ,校正 决定 系数 (Adj. R-Square) 都 在 


OODLE ,说 明 5 个 热点 社区 扩张 与 收敛 模型 构建 结 


果 萎 好 ,校正 决定 系数 可 以 反映 模型 拟 合 结果 的 好 坏 


( 趣 接 近 1 ,说 明 拟 合 结果 越 好 ,负数 说 明 结 


大 9 


社区 模式 


模式 


DES 


RI ”社区 扩张 与 收敛 模式 及 其 基本 特征 


irr 函数 类 型 


基本 公式 


结合 图 8 医疗 健康 信息 领域 Top5 社区 扩张 与 收 
敛 模型 ,对 互联 网 健康 信息 ,健康 信息 行为 和 电子 健康 
言 息 系统 与 技术 等 社区 的 扩张 与 收敛 模式 及 其 基本 特 
征 进 行 归纳 总 结 分 析 。 如 表 3 所 示 : 


扩张 模式 


科学 范式 涌现 ; 


S 形 曲线 函数 


Logistic 模型 


41-45 
" 


收敛 模式 


社区 成 员 少 ; 
社区 成 员 快 速 增加 ; 
处 于 成 长 阶段 
科学 范式 聚焦 深入 ; 
社区 群体 明显 ; 
社区 成 员 逐 渐 减 少 ; 


S 形 


处 于 衰退 阶段 


分 析 可 知 , 随 着 近 几 十 年 信息 技术 的 不 断 进步 , 医 


疗 健康 信息 领域 发 展 良好 , 目前 该 领域 内 社区 扩张 与 
收敛 模式 共存 ;其 中 ,互联 网 健康 信息 、 健 康信 息 行为 
和 电子 健康 信息 系统 与 技术 作为 领域 研究 核心 ,目前 
社区 特征 明显 社区 成 员 较 多 。 总 体 来 看 ,处 于 社区 扩 
张 模式 向 社区 收敛 模式 转变 的 时 期 ,发 展 趋势 符合 S 


BiHil 模型 


= 一 一 一 一 一 +4 
1 + (x/xg) ^ 


形 曲线 函数 中 的 BiHil 模型 (已 过 最 大 值 ,处 于 递减 阶 
段 ,对 应 社区 收敛 模式 ) ;健康 信息 评估 和 健康 管理 作 
为 近年 来 的 新 兴 社 区 ,成 长 态势 明显 ,社区 成 员 不 断 增 
加 ,社区 规模 不 断 扩 大 ,发 展 趋势 符合 S 形 曲 线 函 数 中 


的 Logistic 模型 (快速 成 长 期 ,对 应 社区 扩张 模式 ) 。 


经 过 上 述 分 析 可 得 出 以 下 结论 ,科学 知识 网 络 扩 
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散 过 程 中 的 社区 扩张 与 收敛 时 序 变化 符合 某 些 函 数 模 
型 ,可 以 描述 社区 扩张 和 收敛 时 序 变化 模式 特征 ,具体 
如 下 : 

(1) 社 区 扩张 模式 的 基本 特征 为 科学 范式 涌现 ， 
社区 成 员 少 ,社区 成 员 快 速 增加 ,处 于 科学 生命 周期 中 
的 快速 成 长 阶段 ,符合 S 形 曲 线 函数 中 的 Logistic 模 
型 , 即 快速 成 长 期 ,对 应 社区 扩张 模式 ; 

(2) 社 区 收敛 模式 的 基本 特征 为 该 模式 下 的 社区 
内 部 研究 的 科学 范式 聚焦 、 深 入 ,社区 群体 明显 ,社区 
成 员 逐 渐 减 少 ,处 于 科学 生命 周期 中 的 衰退 阶段 ,符合 
S 形 曲 线 函 数 中 的 BiHl 模型 , 即 已 过 最 大 值 ,处 于 成 
员 递 减 阶段 ,对 应 社区 收敛 模式 。 

由 上 述 科学 知识 网 络 扩散 过 程 中 的 社区 扩张 与 收 
使 模 式 与 特征 分 析 结 果 可 知 ,本 研究 一 方面 印证 了 科 
党 合 识 增长 机 制 (文献 指数 增长 规律 ), 即 学 科 知识 增 
截 s 若 识 扩散 过 程 中 的 集群 (社区 ) 在 前 期 发 展 趋势 符 
售 组 数 增长 特征 ,但 是 也 暴露 出 文献 指数 增长 规律 不 
入 的 一 面 :未 考虑 学 科 领 域 知识 单元 间 的 关联 关系 
Cif) 及 其 互动 规律 , 即 文献 指数 增长 规律 无 法 准 


衙 征 融合 等 现象 背后 的 规律 ;并 且 本 研究 通过 定量 数 
学 迁 模 科学 地 揭示 了 知识 在 科学 共同 体 中 的 扩散 的 时 
序 器 化 模式 与 特征 ,将 科学 知识 扩散 .知识 增长 机 制 、 
知 吝 网 络 社区 演化 .知识 在 科学 共同 体 中 的 扩散 等 研 
完 透 行 了 有 机 融合 ,分 析 了 科学 知识 扩散 过 程 中 的 群 
聚 性 问题 ,对 科学 知识 网 络 中 社区 (社区 、 社 群 、. 群 落 ) 
发 展 过 程 中 的 扩张 .收敛 时 序 演变 过 程 进行 动态 跟踪 
建 模 ,从 而 揭示 科学 知识 网 络 时 序 变化 过 程 中 社区 扩 
张 与 收敛 的 基本 模式 与 特征 ,为 目前 科学 知识 增长 , 知 
识 扩散 和 知识 社区 演化 等 相关 研究 提供 了 有 益 的 研究 
视角 ,具有 一 定 的 借鉴 和 参考 意义 。 


5 结语 


笔者 以 科学 知识 扩散 过 程 中 的 社区 扩张 与 收敛 模 
式 为 研究 问题 ,以 引文 网 络 为 研究 数据 ,在 经 典 复杂 网 
络 分 析 理 论 与 技术 基础 上 ,利用 深度 学 习 技 术 结 合 时 
序 分 析 方 法 ,对 科学 知识 网 络 中 社区 的 扩张 ,收敛 演变 
过 程 进行 动态 跟踪 与 建 模 ,从 而 揭示 科学 知识 扩散 过 
程 中 的 社区 扩张 与 收敛 基本 模式 与 规律 。 本 研究 以 医 
疗 健康 信息 领域 进行 了 案例 研究 ,研究 结果 表明 :社区 


扩张 模式 的 发 展 趋势 符合 S 形 曲线 函数 中 的 Logistic 
模型 ,社区 收敛 模式 的 发 展 趋 势 符合 S 形 曲 线 函 数 中 
的 BiHil 模型 。 本 文 还 存在 一 些 局 限 与 不 足 , 仅 以 医 
疗 健康 信息 领域 为 例 进 行 了 研究 可 能 造成 结果 不 准 
确 , 未 深入 到 具体 文本 内 容 进行 科学 知识 扩散 过 程 中 
的 社区 扩张 与 收敛 模式 研究 ,此 外 ,如 果 采 用 的 社区 划 
分 算法 方法 可 能 会 导致 结论 存在 一 定 差异 。 接 下 来 的 
工作 ,将 进一步 扩大 研究 数据 ,数据 应 当 涉 及 理科 、 工 
科 以 及 人 文 社 科 等 其 他 不 同 的 学 科 领 域 ,并 尝试 研究 
具体 文本 内 容 维度 下 的 研究 主题 的 扩张 与 收敛 问题 。 
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Abstract: | Purpose/significance | Knowledge units in scientific knowledge networks show certain clustering 
and communality, revealing the basic patterns and rules of community expansion and convergence in the process of 
changing the time series of scientific knowledge networks , which has certain significance for expanding and deepening 
the research on the diffusion and transmission of scientific knowledge. | Method/process | Firstly, the adjacency 
matrix was built based on the citation relation, and then the subject knowledge network was constructed. The Louvain 
community detection algorithm in complex network analysis is used to divide the domain knowledge network into com- 
munities. Then, the Graph Embedding technique was used to represent and calculate the community expansion and 
convergence characteristics. Finally, the time series was used as the time series. Logical clues were used to dynami- 
cally track and model the process of expansion and convergence of different communities, so as to reveal the basic 
patterns and laws of community expansion and convergence in the process of time series change of scientific knowl- 
edge network. | Result/conclusion | A case study in the field of health information shows that the trend of communi- 
ty expansion conforms to the Logistic model in the S-shaped curve function and the trend of community convergence 
conforms to the BiHill model in the S-shaped curve function. 


Keywords: knowledge network | community detection graph embedding expansion model convergence model 
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